“FP8 精度”如何赋能国产AI?
如今,大模型的算力饥渴与“内存墙”困境日益尖锐。模型参数规模指数级增长从千亿到了万亿,大模型的“膨胀速度”堪称“失控”:从BERT的3.4亿参数到GPT-3的1750亿,再到如今超万亿参数的模型,每两年参数规模增长约240倍。但GPU显存的增长却像“蜗牛爬”—
如今,大模型的算力饥渴与“内存墙”困境日益尖锐。模型参数规模指数级增长从千亿到了万亿,大模型的“膨胀速度”堪称“失控”:从BERT的3.4亿参数到GPT-3的1750亿,再到如今超万亿参数的模型,每两年参数规模增长约240倍。但GPU显存的增长却像“蜗牛爬”—
近日,图计算领域最具影响力的国际赛事2025年图计算挑战赛(HPEC Graph Challenge)结果揭晓。本次比赛吸引了来自麻省理工学院、芝加哥大学、英伟达、北京大学等全球顶尖团队参赛,华中科技大学软件学院参赛团队凭借创新方案“PRISM: Practi
华科 计算机学院 软件学院 内存墙 华中科技大学软件学院 2025-08-25 17:22 3
作为全球增速最快的AI应用,DeepSeek上线20天来,日活用户数突破2000万,目前达到了ChatGPT的23%,并且应用每日下载量接近500万。饶毅教授甚至在其个人公众号上评价道,“DeepSeek是鸦片战争以来,中国对人类最大的科技震撼。”